Microsoft Word 2003 XML
· 1 мин. чтения
Продукт Microsoft, Word 2007 проработан основательно - изменён не только дизайн но и введена поддержка XML экспорта. Увы структура его неизвестна, а ресурс, указанный в качестве документации, schemas.microsoft.com пуст.
Сама по себе схема также известна как WordProcessingML и её простейший вид:
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<?mso-application progid="Word.Document"?>
<w:wordDocument xmlns:w="http://schemas.microsoft.com/office/word/2003/wordml">
<w:body>
<w:p>
<w:r>
<w:t>WordML -- XML in Microsoft Word 2003</w:t>
</w:r>
</w:p>
</w:body>
</w:wordDocument>
Что это предоставляет? Теперь возможно экспортировать информацию в xml, а затем при помощи парсера распознавать нужные блоки и использовать в своём приложении, т.е. фактически возможен Data Mining. Другое дело что порою легче сделать copy-paste, но я не рассматриваю этот вариант пока что.
Список документации:
- MSDN информации
- XML in office
- WordprocessignML overview от датчан
Некоторые готовые продукты..
- WordMLToFO XSLT конвертор платный